草庐IT

LLM 评估

全部标签

大数据---聚类分析概述及聚类评估

聚类概述:什么是聚类?是把数据对象集合按照相似性划分成多个子集的过程。每个子集是一个簇(cluster),分类的最终效果:使得簇中的对象彼此相似,但与其他簇中的对象相异。聚类是无监督学习,因为给的数据没有类标号信息。分类和聚类的区别分类有监督学习;通过带标签的样本进行学习,生成分类模型(分类器)。聚类无监督学习;通过观察学习,根据样本间的相似性将数据分割成多个簇。基本聚类方法划分方法层次方法基于密度的方法划分方法划分方法:将有n个对象的数据集D划分成k个簇,并且k≤n,满足如下的要求:每个簇至少包含一个对象每个对象属于且仅属于一个簇基本思想:首先创建一个初始k划分(k为要构造的划分数,即簇的个

android - 无法评估模块 FacebookLib : Configuration with name 'debug' not found

当我运行命令“cordovabuildandroid”时出现此错误。我在platforms/android目录中的“build.gradle”文件中有以下代码行:debugCompile(project(path:"phonegap-facebook-plugin:FacebookLib",configuration:"debug"))releaseCompile(project(path:"phonegap-facebook-plugin:FacebookLib",configuration:"release"))在同一目录中,我有另一个文件“settings.gradle”,其中包

大语言模型(LLM)的进化树,学习LLM看明白这一张图就够了

近期大语言模型迅速发展,让大家看得眼花缭乱,感觉现在LLM的快速发展堪比寒武纪大爆炸,各个模型之间的关系也让人看的云里雾里。最近一些学者整理出了ChatGPT等语言模型的发展历程的进化树图,让大家可以对LLM之间的关系一目了然。论文:https://arxiv.org/abs/2304.13712Github(相关资源):https://github.com/Mooler0410/LLMsPracticalGuide最重要的进化树图:进化的树图现代语言模型的进化树追溯了近年来语言模型的发展,并强调了一些最著名的模型。同一分支上的模型关系更近。基于Transformer的模型显示为非灰色颜色:仅

改进召回(Retrieval)和引入重排(Reranking)提升RAG架构下的LLM应用效果

改进召回(Retrieval)和引入重排(Reranking)提升RAG架构下的LLM应用效果原创 ully AI工程化 2023-08-2421:08收录于合集#LLM应用架构3个#领域技术13个动手点关注干货不迷路如前文LLM应用架构之检索增强(RAG)的缘起与架构介绍,RAG架构很好的解决了当前大模型Promptlearning过程中contextwindow限制等问题,整体架构简明清晰,易于实现,得到了广泛的应用,但实际落地过程中有大量的实际问题需要改进优化。llamaindex实现下的RAG架构以RAG召回为例,最原始的做法是通过top-k的方式从向量数据库中检索背景数据然后直接提交

transformer大语言模型(LLM)部署方案整理

说明大模型的基本特征就是大,单机单卡部署会很慢,甚至显存不够用。毕竟不是谁都有H100/A100,能有个3090就不错了。目前已经有不少框架支持了大模型的分布式部署,可以并行的提高推理速度。不光可以单机多卡,还可以多机多卡。我自己没啥使用经验,简单罗列下给自己备查。不足之处,欢迎在评论区指出。框架名称出品方开源地址FasterTranaformer英伟达FasterTransformergithubTGIhuggingfacehuggingface/text-generation-inferencevLLM伯克利大学LMSYS组织github-vllmdeepspeed微软github.com

大语言模型(LLM)综述(三):大语言模型预训练的进展

ASurveyofLargeLanguageModels前言4.PRE-TRAINING4.1数据收集4.1.1数据源4.1.2数据预处理4.1.3预训练数据对LLM的影响4.2模型架构4.2.1典型架构4.2.2详细配置4.2.3预训练任务4.2.4解码策略4.2.5总结和讨论4.3模型训练4.3.1优化设置4.3.2可扩展的训练技术前言随着人工智能和机器学习领域的迅速发展,语言模型已经从简单的词袋模型(Bag-of-Words)和N-gram模型演变为更为复杂和强大的神经网络模型。在这一进程中,大型语言模型(LLM)尤为引人注目,它们不仅在自然语言处理(NLP)任务中表现出色,而且在各种跨

scipy.optimize.timimize用鲍威尔方法违反最大功能评估

我正在使用scipy.optimize.minimize与Powell算法优化一个函数。有一个名为MaxFev的选项来设置最大功能评估。但是,它似乎并不总是有效。算法跨越功能评估限制。代码如下:deffunc_eval(x):importmathasmathfuncval=0dimension=len(x)tmp=0tmp2=0foriinrange(dimension):tmp+=x[i]foriinrange(dimension):tmp2=(tmp-x[i])*x[i]funcval+=dimension*(math.pow(x[i],2)+0.4*tmp2)returnfuncvalf

【论文阅读】Jailbroken: How Does LLM Safety Training Fail?

越狱:大语言模型安全训练何以失败本文的目标是分析LLM能够被越狱的原因论文地址:https://arxiv.org/abs/2307.024831.Jailbreak介绍随着大模型的应用越来越广泛,有一些人就想利用大模型去获得一些有害信息。所以现在的大语言模型在预训练之后都会经过安全训练阶段,这个阶段会设置一些安全措施,比如过滤和对齐等,让模型的输出符合人类价值观,训练它拒绝提供有害信息的请求,如图1这种有害问题,它就会拒绝回答.图1越狱攻击就是通过设计Prompt,绕过大模型开发者为其设置的安全和审核机制,利用大模型对输入提示的敏感性和容易受到引导的特性,诱导大模型生成不合规的、本应被屏蔽的

以安全促发展——《数据出境安全评估办法》解读

各国关于数据出境的监管要求一直是各国数据监管的风向标,不仅体现国家对于数据安全的重视程度,也能意会出国家对于数据竞争的态度以及数字经济发展的思路。例如欧盟《通用数据保护条例》(GDPR)设定的个人数据出境的限制,规定在第三国具备充分保护水平的前提下可将个人数据向第三国传输,而如第三国不具备充分保护水平的,控制者或处理者只有在提供了适当的保障措施,并为数据主体提供了可执行的权利和有效的法律救济措施的条件下,才可将个人数据传输至第三国。上述内容是对于个人数据出境的特殊监管要求,也是解决欧盟单一数字经济发展面临制度障碍的尝试。数据出境的监管对于数字经济蓬勃发展的中国也尤为重要。一方面需要树立数据监管

【聚类指标】如何评估聚类算法:外部指标和内部指标、指标详解

【聚类指标】如何评估聚类算法:外部指标和内部指标、指标详解文章目录【聚类指标】如何评估聚类算法:外部指标和内部指标、指标详解1.前言2.外部指标2.1P(Purity)2.1.1例子2.2NMI(NormalizedMutualInformation)2.2.1例子2.3对混淆矩阵(RI、Precision、Recall、F)2.3.1RI(兰德系数)2.3.2Precision(精确度)2.3.3Recall(召回率)2.3.4F值(平衡精确度与召回率)2.3.5例子2.4ARI(调整兰德系数)2.5AC(Accuracy)3.内部指标3.1紧密度(Compactness)3.2分割度(Se